Voici la Boîte à Outils 4
"Des textes aux Graphes"

Le but de la Boîte à Outils 4, c'est de construire des graphes à l'aide de "motifs", c'est-à-dire un mot qu'on a choisi afin de savoir quelles sont ses cooccurrences.

Afin d'effectuer les graphes, il faut utiliser le programme "patron2graphe.exe".

Ce dernier s'utilise à l'aide de la fenêtre de commande, de l'encodage choisi, du motif et du fichier de sortie de la BAO3 (avec Cordial ou Treetagger).

Voici la ligne à écrire lors de l'utilisation de celui-ci :

Attention à ne pas oublier "./" au tout début pour donner le chemin du programme, sinon cela ne fonctionne pas.

J'ai pris comme motif deux mots à chaque fois pour chaque fichier de sortie.

Avec le fichier sortie_3208_cordial.txt :

J'ai choisi deux mots représentant le plus le fichier : fraude et président

Voici les graphes générés avec ces mots :

Résultat disponible aussi ICI car la quantité d'informations ne permet pas une bonne vision d'ensemble sur l'image

On peut voir que la rubrique A la Une était plutôt concentrée sur l'actualité politique en 2017.


________________________________

Avec le fichier sortie_3208_treetagger.txt :

J'ai choisi deux mots représentant le plus le fichier : politique et parisien

Voici les graphes générés avec ces mots :

Résultat disponible aussi ICI car la quantité d'informations ne permet pas une bonne vision d'ensemble sur l'image

Résultat disponible aussi ICI car la quantité d'informations ne permet pas une bonne vision d'ensemble sur l'image

Encore une fois, c'est l'aspect politique qui l'emporte sur la rubrique.


________________________________

Avec le fichier sortie_3246_cordial.txt :

J'ai choisi deux mots représentant le plus le fichier : film et art

Voici les graphes générés avec ces mots :

Résultat disponible aussi ICI car la quantité d'informations ne permet pas une bonne vision d'ensemble sur l'image

Résultat disponible aussi ICI car la quantité d'informations ne permet pas une bonne vision d'ensemble sur l'image

Pour la rubrique concernant la culture, on peut voir une majorité de mots autour de celui-ci : art, films, musique...


________________________________

Avec le fichier sortie_3246_treetagger.txt :

J'ai choisi deux mots représentant le plus le fichier : festival et musique

Voici les graphes générés avec ces mots :

Résultat disponible aussi ICI car la quantité d'informations ne permet pas une bonne vision d'ensemble sur l'image

Résultat disponible aussi ICI car la quantité d'informations ne permet pas une bonne vision d'ensemble sur l'image

Sans grande surprise, ici aussi la culture est mise en évidence.


________________________________

Avec le fichier sortie_3214_cordial.txt :

J'ai choisi deux mots représentant le plus le fichier : social et gouvernement

Voici les graphes générés avec ces mots :

Résultat disponible aussi ICI car la quantité d'informations ne permet pas une bonne vision d'ensemble sur l'image

Résultat disponible aussi ICI car la quantité d'informations ne permet pas une bonne vision d'ensemble sur l'image

Sur la rubrique Europe, la politique est encore au centre des articles. L'aspect social fait quand même surface et est au centre des questions politiques européeennes.


________________________________

Avec le fichier sortie_3214_treetagger.txt :

J'ai choisi deux mots représentant le plus le fichier : police et terroriste

Voici les graphes générés avec ces mots :

Résultat disponible aussi ICI car la quantité d'informations ne permet pas une bonne vision d'ensemble sur l'image

Résultat disponible aussi ICI car la quantité d'informations ne permet pas une bonne vision d'ensemble sur l'image

La rubrique Europe est aussi frappée par le terrorisme. De ce fait, on voit bien la surreprésentation de ce mot, ainsi qu'un mot qui l'accompagne forcément : la police.